智能论文笔记

FOCUS: Fairness via Agent-Awareness for Federated Learning on Heterogeneous Data

Wenda Chu , Chulin Xie , Boxin Wang , Linyi Li , Lang Yin , Han Zhao , Bo Li

分类：机器学习

2022-07-21

联合学习（FL）提供了一个有效的范式，可以通过隐私保护训练机器学习模型。但是，最近的研究表明，由于可能是恶意和异质的当地代理商，FL受到各种安全，隐私和公平威胁的约束。例如，它容易受到仅贡献低质量数据的本地对抗药物的攻击，目的是损害具有高质量数据的人的性能。因此，这种攻击破坏了FL中公平性的现有定义，主要集中于某种绩效奇偶校验的概念。在这项工作中，我们旨在解决此限制，并通过对FL（FAA）的代理意识（FAA）提出正式的公平定义，该定义将当地代理的异质数据贡献考虑在内。此外，我们提出了基于代理聚类（焦点）的公平FL培训算法以实现FAA。从理论上讲，我们证明了线性模型的温和条件下的聚焦和最优性，并且具有有界平滑度的一般凸丢失函数。我们还证明，在线性模型和一般凸损耗函数下，与标准的FedAvg协议相比，FAA始终达到FAA衡量的更高公平性。从经验上讲，我们评估对四个数据集的重点，包括不同设置下的合成数据，图像和文本，并且我们表明，与FedAvg相比，基于FAA的焦点基于FAA的公平性显着更高，同时保持相似甚至更高的预测准确性。

translated by 谷歌翻译

CKD-TransBTS: Clinical Knowledge-Driven Hybrid Transformer with Modality-Correlated Cross-Attention for Brain Tumor Segmentation

Jianwei Lin , Jiatai Lin , Cheng Lu , Hao Chen , Huan Lin , Bingchao Zhao , Zhenwei Shi , Bingjiang Qiu , Xipeng Pan , Zeyan Xu

分类：计算机视觉

2022-07-15

磁共振图像（MRI）中的脑肿瘤分割（BTS）对于脑肿瘤诊断，癌症管理和研究目的至关重要。随着十年小型挑战的巨大成功以及CNN和Transformer算法的进步，已经提出了许多出色的BTS模型来解决BTS在不同技术方面的困难。但是，现有研究几乎没有考虑如何以合理的方式融合多模式图像。在本文中，我们利用了放射科医生如何从多种MRI模态诊断脑肿瘤的临床知识，并提出了一种称为CKD-TRANSBTS的临床知识驱动的脑肿瘤分割模型。我们没有直接串联所有模式，而是通过根据MRI的成像原理将输入方式分为两组来重新组织输入方式。具有拟议模态相关的跨意义块（MCCA）的双支支混合式编码器旨在提取多模式图像特征。所提出的模型以局部特征表示能力的能力来继承来自变压器和CNN的强度，以提供精确的病变边界和3D体积图像的远程特征提取。为了弥合变压器和CNN功能之间的间隙，我们提出了解码器中的反式和CNN功能校准块（TCFC）。我们将提出的模型与五个基于CNN的模型和六个基于Transformer的模型在Brats 2021挑战数据集上进行了比较。广泛的实验表明，与所有竞争对手相比，所提出的模型可实现最先进的脑肿瘤分割性能。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Virtual Homogeneity Learning: Defending against Data Heterogeneity in Federated Learning

Zhenheng Tang , Yonggang Zhang , Shaohuai Shi , Xin He , Bo Han , Xiaowen Chu

分类：机器学习 | 人工智能

2022-06-06

在联合学习（FL）中，模型性能通常遭受数据异质性引起的客户漂移，而主流工作则专注于纠正客户漂移。我们提出了一种名为Virtual同质性学习（VHL）的不同方法，以直接“纠正”数据异质性。尤其是，VHL使用一个虚拟均匀的数据集进行FL，该数据集精心制作以满足两个条件：不包含私人信息和可分开的情况。虚拟数据集可以从跨客户端共享的纯噪声中生成，旨在校准异质客户的功能。从理论上讲，我们证明VHL可以在自然分布上实现可证明的概括性能。从经验上讲，我们证明了VHL赋予FL具有巨大改善的收敛速度和概括性能。VHL是使用虚拟数据集解决数据异质性的首次尝试，为FL提供了新的有效手段。

translated by 谷歌翻译

Pooling Revisited: Your Receptive Field is Suboptimal

Dong-Hwan Jang , Sanghyeok Chu , Joonhyuk Kim , Bohyung Han

分类：计算机视觉 | 机器学习

2022-05-30

接收场的大小和形状决定了网络如何聚集本地信息并极大地影响模型的整体性能。神经网络中的许多组件，例如内核大小和用于卷积和汇总操作的大步，都会影响接受场的配置。但是，它们仍然依靠超参数，现有模型的接受场导致了次优的形状和尺寸。因此，我们提出了一个简单而有效的动态优化的合并操作，称为Dynopool，该操作通过学习每一层中其接受场的理想大小和形状来优化特征地图的比例因子。深层神经网络中的任何调整模块都可以用Dynopool的操作取代，而成本最低。此外，Dynopool通过引入限制计算成本的附加损失项来控制模型的复杂性。我们的实验表明，配备了拟议的可学习调整模块的模型优于图像分类和语义分割中多个数据集上的基线网络。

translated by 谷歌翻译

HoVer-Trans: Anatomy-aware HoVer-Transformer for ROI-free Breast Cancer Diagnosis in Ultrasound Images

Yuhao Mo , Chu Han , Yu Liu , Min Liu , Zhenwei Shi , Jiatai Lin , Bingchao Zhao , Chunwang Huang , Bingjiang Qiu , Yanfen Cui

分类：计算机视觉

2022-05-17

超声检查是乳腺癌诊断的重要常规检查，这是由于其无创，无辐射和低成本的特性。但是，由于其固有的局限性，乳腺癌的诊断准确性仍然受到限制。如果我们可以通过乳房超声图像（BUS）精确诊断乳腺癌，那将是一个巨大的成功。已经提出了许多基于学习的计算机辅助诊断方法来实现乳腺癌诊断/病变分类。但是，其中大多数需要预定的ROI，然后对ROI内的病变进行分类。常规的分类骨架，例如VGG16和RESNET50，可以在没有ROI要求的情况下获得有希望的分类结果。但是这些模型缺乏解释性，因此限制了它们在临床实践中的使用。在这项研究中，我们提出了一种具有可解释特征表示的超声图像中乳腺癌诊断的新型无ROI模型。我们利用解剖学的先验知识，即恶性肿瘤和良性肿瘤在不同的组织层之间具有不同的空间关系，并提出了悬停转换器来提出这种先验知识。提出的悬停式跨界块水平和垂直地提取层间和层内空间信息。我们进行并释放一个开放的数据集GDPH＆SYSUCC，以用于公共汽车中的乳腺癌诊断。通过与四个基于CNN的模型和两个Vision Transformer模型进行比较，通过五倍的交叉验证来评估所提出的模型。它通过最佳模型可解释性实现最新的分类性能。同时，我们提出的模型在仅给出一张公交图像时，在乳腺癌诊断方面优于两名高级超声检查员。

translated by 谷歌翻译

MMPTRACK: Large-scale Densely Annotated Multi-camera Multiple People Tracking Benchmark

Xiaotian Han , Quanzeng You , Chunyu Wang , Zhizheng Zhang , Peng Chu , Houdong Hu , Jiang Wang , Zicheng Liu

分类：计算机视觉

2021-11-30

多摄像机跟踪系统在需要高质量跟踪结果的应用中获得普及，例如摩擦结账，因为单眼多物体跟踪（MOT）系统由于闭塞而在杂乱和拥挤的环境中经常失败。通过恢复部分3D信息，多个高度重叠的相机可以显着减轻问题。但是，使用不同的相机设置和背景创建高质量多摄像头跟踪数据集的成本在该域中的数据集比例限制了数据集尺度。在本文中，我们在自动注释系统的帮助下提供了五种不同环境的大型密集标记的多摄像头跟踪数据集。该系统使用重叠和校准的深度和RGB相机来构建高性能3D跟踪器，可自动生成3D跟踪结果。使用摄像机参数将3D跟踪结果投影到每个RGB摄像头视图以创建2D跟踪结果。然后，我们手动检查并更正3D跟踪结果以确保标签质量，比完全手动注释便宜得多。我们使用两个实时多相机跟踪器和具有不同设置的人重新识别（REID）模型进行了广泛的实验。该数据集在杂乱和拥挤的环境中提供了更可靠的多摄像头，多目标跟踪系统的基准。此外，我们的结果表明，在此数据集中调整跟踪器和REID模型显着提高了它们的性能。我们的数据集将在接受这项工作后公开发布。

translated by 谷歌翻译

EAGAN: Efficient Two-stage Evolutionary Architecture Search for GANs

Guohao Ying , Xin He , Bin Gao , Bo Han , Xiaowen Chu

分类：计算机视觉 | 机器学习 | 神经与进化计算

2021-11-30

生成的对抗网络（GANS）已被证明在图像生成任务中非常成功，但GaN培训具有不稳定问题。许多作品通过手动修改GaN架构提高了GaN训练的稳定性，这需要人类专业知识和广泛的试验和错误。因此，目的是自动化模型设计的神经结构搜索（NAS）已经应用于在无条件图像生成的任务上搜索GAN。早期的NAS-GaN仅用于搜索生成器来减少困难。最近的一些作品试图搜索发电机（G）和鉴别器（D）来提高GaN性能，但它们仍然遭受搜索过程中GaN培训的不稳定性。为了缓解不稳定问题，我们提出了一种高效的两阶段进化算法（EA）基于NAS框架来发现GANS，Dubbed \ TextBF {eagan}。具体而言，我们将G和D的搜索分成两个阶段，提出了重量重置策略以提高GaN训练的稳定性。此外，我们执行进展操作以基于多个目标生成帕累托 - 前部架构，导致G和D的优越组合。通过利用重量分享策略和低保真评估，EAGAN可以显着缩短搜索时间。 EAGAN在CIFAR-10上实现了高竞争力的结果（= 8.81 $ \ PM $ 0.10，FID = 9.91），并超越了STL-10数据集上的先前NAS搜索的GAN（= 10.44 $ \ PM $ 0.087，FID = 22.18）。

translated by 谷歌翻译

PDBL: Improving Histopathological Tissue Classification with Plug-and-Play Pyramidal Deep-Broad Learning

Jiatai Lin , Guoqiang Han , Xipeng Pan , Hao Chen , Danyi Li , Xiping Jia , Zhenwei Shi , Zhizhen Wang , Yanfen Cui , Haiming Li

分类：计算机视觉

2021-11-04

组织病理组织分类是病理学癌症研究的基本任务。精确区分不同的组织类型是下游研究的好处，如癌症诊断，预后等。现有的作品主要利用计算机视觉中的流行分类骨干，以实现组织病理组织分类。在本文中，我们提出了一种超级轻型即插即用模块，名为金字塔深广阔的学习（PDBL），对于任何训练有素的分类骨架，以进一步提高分类性能而无需重新培训负担。我们模仿病理学家如何观察不同放大率的病理学幻灯片，并为输入图像构造图像金字塔，以获得金字塔内部信息。对于金字塔中的每个级别，我们通过我们提出的深层块（DB-Block）提取多种深度广泛的功能。我们用三个流行的分类骨干网，Shufflenetv2，EppositionNetB0和Reset50配备了PDBL，以评估我们建议模块在两个数据集（Kather Multiclass DataSet和LC25000数据集）上的提出模块的有效性和效率。实验结果表明，所提出的PDBL可以稳定地改善任何CNN骨架的组织级分类性能，特别是对于在训练样本（小于10％）中的小型时，特别是轻量级模型，这极大地节省了计算时间和注释工作。

translated by 谷歌翻译

Learning Debiased and Disentangled Representations for Semantic Segmentation

Sanghyeok Chu , Dongwan Kim , Bohyung Han

分类：计算机视觉 | 机器学习

2021-10-31

深度神经网络易于学习具有纠缠特征表示的偏置模型，这可能导致各种下游任务的子模式。对于非代表性的类尤其如此，其中数据中缺乏多样性加剧了趋势。这种限制主要是在分类任务中解决的，但对可能出现在更复杂的密集预测问题中可能出现的额外挑战几乎没有研究，包括语义分割。为此，我们提出了一种用于语义细分的模型 - 不可知论和随机培训方案，这有助于了解脱叠和解除戒律的陈述。对于每个类，我们首先从高度纠缠的特征映射中提取特定的类信息。然后，通过特征空间中的特征选择过程抑制与随机采样类相关的信息。通过随机消除每个训练迭代中的某些类信息，我们有效地减少了类之间的特征依赖性，并且该模型能够了解更多的脱叠和解散的特征表示。使用我们的方法培训的模型展示了多个语义细分基准的强烈结果，特别是代表性课程的表现尤为显着。

translated by 谷歌翻译